Extraction et validation par croisement des relations d'une ontologie de domaine

نویسنده

  • Lobna Karoui
چکیده

Face à de grandes quantités de documents web, notre objectif est d’extraire et de valider semi-automatiquement des relations d’un domaine. Dans l’état de l’art, l’extraction des relations a été faite soit par une approche statistique, une approche linguistique ou une approche hybride. De plus, l’intérêt a été toujours porté sur un voire deux types de relations. A contrario, notre objectif est d’extraire des relations de différents types en combinant des analyses de textes et en considérant les caractéristiques des mots. Dans cet article, nous avons défini un algorithme contextuel de découverte de relations qui combine différentes analyses (lexicale, syntaxique et statistique) pour définir des processus complémentaires qui assurent l’extraction de relations variées et pertinentes. Notre algorithme établit des opérations de croisements entre analyses afin de pouvoir valider certaines relations. Les relations valides, comme celles invalides, seront présentées à l’expert du domaine mais séparément.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Conception assistée d'une ontologie à partir d'une conceptualisation consensuelle exprimée de manière semi-formelle

Résumé : Cet article présente une méthodologie assistée de conception d'une ontologie à travers trois méthodes, soit une méthode d'élicitation des connaissances d'un domaine résultant en un modèle semi-formel de ces connaissances, une méthode de formalisation conduisant à la production d’une ontologie et une méthode de validation syntaxique et sémantique de l'ontologie. Les processus de formali...

متن کامل

Détermination automatique des relations sémantiques entre les concepts d'une ontologie

RÉSUMÉ. Les systèmes d’information (SI) actuels sont de plus en plus complexes nécessitant un énorme travail de modélisation, utilisant une quantité énorme des données. Par conséquent, les concepteurs sont confrontés à un ensemble de problèmes liés à la méconnaissance du domaine à modéliser et à la difficulté de déterminer les concepts et leurs relations. Comme solution, nous proposons l’utilis...

متن کامل

Une approche pour la validation du contenu d'une ontologie par un système à base de questions/réponses

Résumé : La construction d’ontologies est un processus itératif qui nécessite une étroite collaboration entre ingénieurs et experts du domaine. La complexité que peut proposer certains domaines comme la médecine combinée à celle des langages de description d’ontologies rendent cette collaboration difficile et génératrice d’erreurs. Dans nos travaux, nous proposons une approche pour la validatio...

متن کامل

Ontologies pour l'aide à l'exploration d'une collection de documents

Dans cet article nous présentons un système à base d'ontologies pour l'aide à une activité de recherche, d'analyse et d'exploration de corpus documentaires relatifs à un domaine scientifique. Les ontologies utilisées visent à représenter un domaine à la fois à travers le vocabulaire de ce domaine, mais également au travers de l'ensemble des méta-données qui peuvent être utiles dans des activité...

متن کامل

Reconnaissance automatique de concepts à partir d'une ontologie

Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008